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摘 要 : [目的 /意义 ] 强 弱 连 接 是 影响 学 科 引 证 知识 扩散 动态 链 路 预测 的 重要 因素 之 一 。 学 科 知 识 扩 散 强 弱 引 证 连接 相 
互 协同 、 相 互 影 响 , 共 同 促进 了 学 科 间 的 知识 交流 、 融 合 与 创新 。 学 科 引 证 知识 扩散 动态 链 路 预测 中 强 弱 连接 效 
应 的 探索 ,可 为 强 弱 连接 理论 应 用 场景 的 拓展 ,学 科 引 证 知识 扩散 行为 微观 演化 规律 的 揭示 以 及 动态 链 路 预测 算 


法 指标 的 评价 、 设 计 与 优化 提供 理论 与 实践 参考 。[ 方法 “过程 ] 依托 内 外 协同 的 思路 理念 ,构建 一 种 外 部 网 络 结 


z= 
> O 构 调 控 与 内 部 微观 演化 机 理 剖 析 相 结合 的 动态 链 路 预测 强 弱 连接 效应 探测 方法 ,分 别 从 学 科 引 证 知识 关联 权重 
Ze 调节 、 连 边 失 效 触发 以 及 强 弱 连 接 模 体 分 析 三 个 维度 ,对 基于 共同 邻居 相似 性 的 学 科 引 证 知识 扩散 动态 链 路 预测 
LO 中 的 强 弱 连 接 效应 问题 进行 探讨 。[ 结果 /结论 ] 强 连 接 在 学 科 引 证 知识 扩散 网 络 演化 及 动态 链 路 预测 过 程 中 扮 
E 演 着 更 加 重要 的 角色 ; 链 路 预测 中 的 强 弱 连 接 现象 不 仅 与 学 科 引 证 关联 权重 有 关 , 还 会 受到 共同 邻居 数目 以 及 网 
9 络 微观 模 体 结构 的 影响 ;知识 宿 学 科 的 吸纳 融合 能 力 相 对 于 知识 源 学 科 的 溢出 辐射 能 力 来 说 ,在 新 连 边 衍生 过 程 

E 中 的 主导 地 位 更 加 突出 。 
Eug. 学 科 引 证 知识 扩散 ” 强 弱 连接 ”权重 调节 连 边 失 效 ”三 元 组 模 体 动态 链 路 预测 
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SZ1974 年 ,美国 社会 学 家 M.S，Granovetter 提出 了 
弱 圳 挟 理 论 " 。 在 传统 社会 ,与 最 亲密 的 人 接触 是 一 
种 稳定 但 传播 范围 有 限 的 社会 认 知 , 称 为 “ 强 连接 " 现 
象 6 强 连 接 关系 代表 着 行动 者 之 间 具 有 高 度 的 互动 。 
与 此 同时 ,存在 一 种 更 为 广泛 但 相对 浅显 的 社会 认 知 ， 
即 “ 弱 连接 "现象 , 弱 连 接 虽然 不 如 强 连接 那样 坚固 ， 


知识 和 新 信息 , 弱 连 接 在 知识 迁移 、 组 织 创新 、 信 息 流 
动 等 方面 都 发 挥 了 重要 的 作用 ”。 学 科 引 证 知识 扩 
散 网 络 中 节点 之 间 的 相互 作用 强度 和 类 型 亦 具 有 一 定 
差异 , 即 存在 学 科 引 证 强 连接 和 弱 连 接 。 学 科 间 的 引 
证 频次 ( 即 关联 权重 ) 较 大 的 连 边 属于 强 连接 , 较 小 的 
连 边 属于 弱 连 接 。 强 弱 引 证 连接 相互 协同 、 相 互 影响 ， 


却 具 有 低 成 本 和 高 效能 的 传播 特点 "” 。 强 弱 连 接 在 
网 络 衍生 、 信 息 传播 扩散 等 方面 扮演 着 重要 的 角色 。 
强 连 接 维 系 了 网 络 社团 内 部 的 高 凝聚 性 互动 关联 , 双 
方 行动 者 可 以 从 强 连 接 中 优先 .轻易 获得 更 强 有 力 的 
支撑 , 比 弱 连 接 更 能 有 效 地 传递 复杂 信息 和 隐 人 性 知 
iU ,然而 却 可 能 带 来 信息 宛 余 .闭塞 等 问题 。 相 对 于 
强 连 接 , 弱 连接 虽 不 稳定 却 连 接 范 围 广泛 ,行动 者 资源 
异 质 化 特征 明显 ,能够 在 不 同 社团 间 传 递 非 重复 的 新 


共同 促进 了 学 科 间 的 知识 交流 、 融 合 与 创新 。 

学 科 引 证 知识 关联 随 着 时 间 不 断 演化 ,如 何 基 于 
现时 网 络 信息 动态 准确 预测 学 科 之 间 未 来 的 引证 链 
路 , 即 学 科 引证 知识 扩散 动态 链 路 预测 问题 ,是 明晰 学 
科 知 识 流 变 趋势 辅助 学 科 知 识 管理 决策 的 有 力 支 撑 。 
对 未 来 可 能 产生 的 连 边 进行 预测 的 核心 是 对 网 络 演化 
规律 的 把 握 , 网 络 微观 结构 (尤其 是 强 弱 连接 模式 ) 的 
变化 对 网 络 演化 起 到 了 至 关 重 要 的 作用 。 模 体 ( mo- 
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tif) , 即 网 络 中 频繁 出 现 的 局 部 连接 模式 ” ,作为 一 种 
重要 的 网 络 微观 结构 ,其 演化 特性 可 以 客观 地 揭示 网 
种 结构 特征 的 变化 ”。 如 果 能 够 准确 掌握 强 弱 连接 微 
见 结构 的 演化 规律 ,分 析 微 观 模 体 的 变化 趋势 , 便 能 

加 有 效 地 预测 网 络 的 整体 演化 方向 ,进而 促进 链 路 
预测 算法 的 设计 与 改进 。 有 研究 发 现 权 重 较 大 的 强 连 
接 在 链 路 预测 中 起 到 了 较 大 的 作用 , 即 链 路 预测 中 存 
在 强 连 接 效应 ;而 有 的 研究 则 发 现 权 重 较 小 的 弱 连 
接 扮 演 着 更 为 重要 的 角色 , 即 链 路 预测 中 存在 弱 连 接 
AW UU 。 根 据 前 期 研究 发 现 ,在 对 学 科 引证 知识 扩散 
演化 网 络 进行 预测 的 过 程 中 ,有 些 算 法 指标 考虑 权重 
后 预测 效果 得 到 提升 ,有 些 则 不 然 , 即 存在 一 定 程度 的 
强 弱 连 接 效应 ,说 明 强 弱 连 接 是 影响 学 科 引 证 知识 
抗 向 动态 链 路 预测 的 重要 因素 之 一 。 学 科 引 证 知识 扩 
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科目 前 ,国内 外 学 者 针对 链 路 预测 中 的 强 弱 连 接 问 
BEI TVEAHACR. T. Murata 等 基于 可 通过 网 络 拓 
HEAR RE B BURCH A3 F3 8 2t I] far Re i AER 
设 3H 绍 了 一 种 利用 网 络 加 权 邻 近 度 来 进行 链 路 预测 
的 活 进 方法 ,并 在 密集 社交 网 络 上 证 实 了 该 方法 的 有 
BOE, L. Y. La 等 在 加 权 网 络 链 路 预测 指标 的 基 


础 二 ,引入 调节 参数 ,探讨 了 网 络 中 强 连接 和 弱 连 接 对 
于 僵 路 预测 的 作用 ,并 利用 模 体 分 析 方法 给 出 了 半 定 
EART, H. Liu 等 提出 了 一 种 基于 共同 邻居 节点 
中 心 度 和 弱 连 接 的 链 路 预测 模型 ,实证 研究 表明 该 模 
型 的 表现 优 于 CN AA 和 RA 算法 '" o N. Seu 等 利用 
加 性 加 权 模 型 .最 小 流量 模型 和 乘法 模型 在 10 个 不 同 
特征 数据 集 上 研究 了 连接 权重 对 基于 节点 相似 性 的 链 
接 预 测 方法 的 影响 ,结果 发 现 不 同 加 权 模 型 的 表现 会 
有 所 不 同 ,该 差异 与 所 采用 的 预测 方法 和 数据 集 有 
X. K. K. Shang 等 提出 了 直接 连 边 预 测算 法 , 提 
高 了 演化 网 络 上 链 路 预测 算法 的 精度 ,分 析 发 现 共同 
邻居 数目 对 弱 连 接 现 象 的 形成 起 着 重要 作用 5 B. 
Liu 等 提出 了 一 个 结合 零 模型 的 通用 框架 ,以 量化 拓扑 
结构 权重 分 布 对 加 权 网 络 中 链 路 预测 的 影响 "9 。K. 
J. Chen 等 设计 了 一 种 名 为 iBridge 的 新 链 路 预测 方 
法 ,可 以 有 效 实现 桥梁 连接 的 识别 ,弥补 了 传统 链 路 预 
测 方法 在 预测 弱 连接 方面 的 准确 性 不 如 强 连 接 高 的 不 


| 
综 上 已 有 研究 ,在 取得 成 绩 的 同时 ,也 存在 一 些 不 
足 之 处 :中 从 研究 对 象 上 看 ,对 链 路 预测 中 的 强 弱 连接 
效应 问题 的 讨论 大 多 集中 在 航空 合作、 社交 、 神 经 等 
静态 网 络 中 ,而 鲜 有 针对 学 科 引 证 知识 扩散 动态 时 变 
演化 网 络 的 研究 。 包 链 路 预测 指标 的 考察 不 够 全 面 ， 
引证 关联 强度 对 动态 链 路 预测 算法 鲁 棒 性 的 影响 有 待 
明确 。(3) 对 链 路 预测 强 弱 连接 现象 与 网 络 (尤其 是 有 
向 网 络 ) 微 观 连 边 演化 特性 之 间 关 系 的 把 握 不 够 清晰 。 
因此 , 强 弱 连接 对 于 学 科 引 证 知识 扩散 网 络 中 动态 链 
路 预测 的 影响 还 有 待 进一步 的 探讨 与 思考 。 

采用 不 同 算法 指标 进行 知识 扩散 动态 链 路 预测 
时 ,对 于 学 科 引 证 关联 权重 的 强化 或 抑制 起 到 了 怎样 
的 作用 ? 不 同 权 重 的 学 科 引证 连 边 的 缺失 对 预测 算法 
精度 有 何 影 响 ” 与 邻居 学 科 具 有 不 同 强 弱 引证 关联 模 
式 的 两 学 科 之 间 究 竟 表 现 出 怎样 的 连 边 倾向 性 ? 学 科 
引证 知识 扩散 行为 演化 规律 对 于 动态 链 路 预测 算法 指 
标的 评价 .设计 与 优化 有 何 局 示 ? 
基于 以 上 研究 问题 ,本文 依托 内 外 协同 (内 因 外 象 
双重 驱动 ) 的 思路 理念 ,构建 了 一 种 外 部 网 络 结构 调控 
与 内 部 微观 演化 机 理 训 析 相 结合 的 动态 链 路 预测 强 弱 
连接 效应 探测 方法 ,从 学 科 引 证 知识 关联 权重 调节 E 
边 失效 触发 以 及 强 弱 连 接 模 体 分 析 三 个 维度 ,对 基于 
共同 邻居 相似 性 的 学 科 引 证 知识 扩散 动态 链 路 预测 中 
的 强 弱 连接 效应 问题 进行 了 系统 讨论 。 

2 研究 设计 

学 科 引 证 知识 扩散 动态 链 路 预测 强 弱 连 接 效应 研 
究 路 线 见 图 1。 该 过 程 划分 为 两 大 模块 三 个 阶段 ,其 
中 两 大 模块 是 指 外 部 网 络 结构 调控 和 内 部 微观 演化 机 
理 剖 析 模 块 , 外 部 调控 模块 包括 学 科 引 证 知识 关联 权 
重 调节 以 及 连 边 失 效 触发 分 析 两 个 阶段 ,内 部 解析 模 
块 对 应 于 强 弱 连接 模 体 分 析 阶 段 ,具体 如 下 : 

(1) 基 于 权重 调节 的 学 科 引 证 知识 扩散 动态 链 路 
预测 强 弱 连接 效应 分 析 : 在 有 向 加 权 网 络 中 的 共同 邻 
居 相 似 性 链 路 预测 指标 的 基础 上 ,引入 参数 a 调节 学 
科 引 证 知识 关联 权重 ,测度 参数 调节 下 的 强 弱 连 接 对 
预测 学 科 引 证 知识 扩散 链 路 效果 的 影响 。 

(2) 基 于 连 边 失效 的 学 科 引 证 知识 扩散 动态 链 路 
预测 强 弱 连接 效应 分 析 : 采 用 权重 差异 化 连 边 ( 链 路 ) 
失效 策略 , 即 按照 连 边 权重 大 小 ,有 选择 地 移 除 学 科 引 
证 知识 扩散 网 络 中 的 连 边 , 从 缺失 性 视角 揭示 强 弱 连 
接 对 学 科 引证 知识 扩散 动态 链 路 预测 算法 维持 其 预测 
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图 1 研究 路 线 


效能 的 能 力 。 
加 (3 ) 学 科 引 证 知识 扩散 时 序 演化 网 络 强 弱 连接 模 
仿 寂 析 : 从 学 科 引 证 知识 扩散 时 序 网 络 微观 演化 人 手 ， 
- su ac 
XE L3 , BRA DAREK I TF SERE LA EREN 
HEHE EIE ARTE f A o P CE AE e b f 
hs ev Ss eL EE 
2UTZ 学 科 引 证 知识 扩散 动态 链 路 预测 过 程 

(5 在 学 科 引 证 知识 扩散 网 络 G 中 ,节点 代表 学 科 , 连 
边 乱 表 学 科 间 的 引证 知识 连接 。 随 着 时 间 的 推移 ,网 
络 蚀 的 学 科 及 其 知识 关联 会 发 生动 态 变迁 。 将 t 时 刻 
的 网 络 C, 作为 训练 网 络 ,给 定 一 种 链 路 预测 算法 ,对 
G, 中 每 组 学 科 对 (x, y) 赋 予 一 个 相似 度 值 5, ,该 值 代 
表 了 两 学 科 间 将 来 产生 引证 知识 链 路 的 潜力 大 小 ,从 
而 形成 预测 网 络 。S,, 越 大 ,表示 学 科 对 之 间 借 助 文献 
引证 发 生 知识 扩散 行为 的 可 能 性 越 高 中 。 以 t+1 时 
刻 的 网 络 GC,,, 作 为 测试 网 络 ,利用 测试 网 络 与 预测 网 
络 的 信息 ,结合 学 科 引 证 知识 扩散 动态 演化 网 络 中 的 
AUC 评价 指标 , 即 测试 网 络 G6,,, 中 新 增加 边 ( 即 
在 Gu 中 新 衍生 出 的 ,原本 在 G, 中 不 存在 的 学 科 引 证 
知识 扩散 连 边 ) 的 相似 度 值 比 G,,; 中 任意 一 条 不 存在 
边 的 相似 度 值 高 的 概率 ,从 整体 上 衡量 链 路 预测 算法 
的 效能 。 为 了 确保 评价 结果 的 稳定 性 ,以 1 年 为 间隔 
进行 4 次 迭代 预测 ( 设 初始 时 刻 为 ,终止 时 刻 为 1,)， 
分 别 计算 历次 预测 的 精度 值 AUC, .AUC,、…、AUC,, 根 
据 其 数据 分 布 特征 选择 合适 的 统计 参量 对 指标 效能 进 


行 综合 考量 ”。 
2.2 基于 权重 调节 的 学 科 引 证 知识 扩散 动态 链 路 预 
测 强 弱 连 接 效应 分 析 

前 期 对 不 同 链 路 预测 指标 在 学 科 引 证 知识 扩散 演 
化 网 络 中 适用 性 的 研究 显示 :LHN- T 指标 的 预测 效果 
最 差 , 稳 定性 也 最 低 ,不 适 于 对 学 科 引 证 知识 扩散 过 程 
进行 动态 链 路 预测 , 因此, 本文 将 其 进行 了 排除 。 
学 科 引证 知识 扩散 网 络 中 的 含 参数 含 权 共 同 邻 居 相 似 
性 链 路 预测 指标 ”如 表 1 BUR: 

表 1 学科 引证 知识 扩散 网 络 中 的 含 参数 含 权 

共同 邻居 相似 性 链 路 预测 指标 

相似 性 指标 公式 


一 | 


S= 2. 


Wo (x,2) * * wi(z,y)* 
zeTou( NTny) "07 a 


CN 


wx ,2) * t wi, (2, y)? 


Salton Syy = X 
Soul) XSin(y) 


zeTou(*) NTin(y) 


Won(x,2)* +win(z,y)* 


Jaccard Som È = - 
9 oserauGO n Dio) Sou(%) Su (y) -w(x,y)? 
Wo (X ,2) * * wi(z,y)* 
Sorenson $,,22x k3 wou (7) + win( zy)® 
eLm INLO) Soult) +Sin(y) 
eo 3 Wou(X,2) t wi(z,y)^ 
HPI IN NECEM 
ze ay GO nra) MIN | Sox) , Si y) 
aii b » wo (8,2) * € wi (iy)? 
Sp nr ax|S Sn(y)! 
zelo) nra o) MAX | Sou(%), Sin(y) 
> Wou(X,2) t wi(z,y)^ 
m Se oragon) ded em.) — 
zeTou(x)NTin(y) lg e Soul) ) 
KA 5 - 5 ou (2) t wer y) 
ze Poula) AT in) Sou(z) 


式 中 ,对 于 学 科 x y 以 及 二 者 的 共同 邻居 z, 定 义 
T. GO 为 学 科 x 的 出 度 邻 届 集 ,T,(y) 为 学 科 y 的 入 度 
邻居 集 ;w(x, z) 为 学 科 x 指向 z 的 知识 扩散 连接 的 
权重 ( 即 学 科 z 引 证 x 的 频次 ) ,w, (z, y) WER z 
向 y 的 知识 扩散 连接 的 权重 ,w(x, y) 为 学 科 x 指向 y 
的 知识 扩散 连接 的 权重 ;Suw (1) = wu Gs) R 
示 学 科 x 指向 其 邻居 学 科 的 知识 扩散 连接 的 调节 权重 
之 和 ,S,(7) = Y, ,ur(z,7) "表示 学 科 y 的 邻居 学 科 
指向 y 的 知识 扩散 连接 的 调节 权重 之 和 ,Su (2) = 
o È noo (2) 表示 学 科 x\y 的 共同 邻居 = 指向 。 
的 邻居 学 科 的 知识 扩散 连接 的 调节 权重 之 和 。 

当 a =0 时 , 即 为 无 权 学 科 引 证 知识 扩散 网 络 中 的 
共同 邻居 相似 性 链 路 预测 指标 形式 ; 当 a = 1 时 , 即 为 
加 权 网 络 中 的 链 路 预测 指标 形式 。 当 a <0 时 ,表示 能 
连接 在 链 路 预测 中 起 到 更 加 重要 的 作用 ; 当 a > 0 时 ， 
表示 强 连接 在 链 路 预测 中 起 到 更 加 重要 的 作用 。w 的 
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绝对 值 越 大 , 强 弱 连接 的 影响 程度 越 显著 。 
2.3 ”基于 连 边 失效 的 学 科 引 证 知识 扩散 动态 链 路 预 
测 强 弱 连 接 效应 分 析 

学 科 引 证 知识 扩散 网 络 属于 复杂 网 络 的 范畴 ,其 
异 质 性 拓扑 结构 决定 了 网 络 中 每 条 知识 扩散 链 路 的 重 
要 程度 存在 一 定 差异 ,一 旦 具有 高 价值 (高 知识 负载 、 
高 枢纽 性 等 ) 的 链 路 发 生 断 裂 , 大 量 与 之 相连 的 学 科 会 
失去 连接 方向 ,网 络 的 结构 和 知识 传输 性 能 会 发 生 改 
变 ,从 而 导致 依托 于 网 络 拓扑 结构 信息 的 学 科 引 证 
知识 扩散 动态 链 路 预测 算法 指标 的 性 能 受到 影响 , 功 
能 无 法 有 效 地 发 挥 。 本 文采 用 权重 差异 化 连 边 ( 链 
路 ) 失 效 策略 ,从 缺失 性 视角 揭示 强 弱 连 接 对 学 科 引 证 
知识 扩散 动态 链 路 预测 算法 精度 的 影响 ,考察 维持 其 
预测 效能 的 能 
,之 所 谓 连 边 失 效 是 指 按 照 一 定 的 规则 ,有 选择 地 移 
除 饮 科 引 证 知识 扩散 网 络 中 的 连 边 。 权 重 差异 化 连 边 
类 魏 则 特 指 按照 连 边 权 重大 小 ,有 选择 地 移 除 学 科 引 
证 到 识 扩散 网 络 中 的 连 边 。 按 照 具 有 不 同 权重 的 连 边 
失 背 顺序 的 不 同 ,可 划分 为 强 连 接 失效 和 弱 连 接 失效 
"ge. 
OJO ) 强 连接 失效 :按照 学 科 间 引证 频次 的 高 低 ( 即 
ADARE) 由 大 到 小 进行 排序 ,由 强 到 弱 顺 次 移 除 连 


[E 


m s 


OD 弱 连 接 失效 :按照 学 科 间 引证 频次 的 高 低 ( 即 


连通 权重 ) 由 小 到 大 进行 排序 ,由 弱 到 强 顺 次 移 除 连 


Xie 
王选 定 一 种 链 路 预测 算法 ,分 别 按照 两 种 策略 , 移 除 
网 终 中 相同 比例 (10% .20% ,30% .40% .50% .60% 、 
7096 .80% .90% 100% ) 的 学 科 引 证 连 边 ,形成 学 科 知 
识 扩 散 阻 断 网 络 GA G, ,将 其 作为 训练 网 络 ,以 学 科 
引证 知识 扩散 完整 网 络 C,,, 作为 测试 网 络 ,计算 AUC 
值 ,对 比 强 弱 连接 缺失 所 造成 的 知识 扩散 动态 链 路 预 
测 性 能 差异 。 
2.4 学 科 引 证 知识 扩散 时 序 演化 网 络 强 弱 连接 模 体 
分 析 

基于 共同 邻居 相似 性 的 动态 链 路 预测 算法 主要 依 
赖 于 网 络 中 的 拓扑 结构 信息 ,其 预测 效果 的 优 劣 在 很 
大 程度 上 取决 于 算法 指标 的 设计 能 否 抓 住 目标 网 络 的 
结构 特征 及 演化 规律 ”。 学 科 引 证 知识 扩散 网 络 随 
着 时 间 的 推移 不 断 发 生变 化 ,这 些 变 化 主要 体现 在 学 
科 之 间 的 引证 情况 以 及 学 科 知 识 扩散 网 络 结构 特征 的 
改变 。 学 科 知 识 扩散 网 络 结构 特征 主要 受 学 科 之 间 引 
证 行为 的 影响 ,同时 学 科 之 间 的 引证 连接 会 形成 一 些 


微观 结构 ,如 三 个 学 科 之 间 形 成 的 团体 结构 , 即 三 元 组 
模 体 " 。 模 体 的 不 断 变化 、 相 互 作用 促使 学 科 引 证 知 
识 扩散 网 络 中 新 连 边 的 衍生 。 在 学 科 引 证 知识 扩散 网 
络 中 ,可 能 存在 的 三 元 组 模 体 类 型 共 16 种 ,如 图 2 
所 示 : 
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图 2 学 科 引 证 知识 扩散 网 络 中 的 16 种 三 元 组 模 体 


每 个 类 别 由 3 -4 个 数字 .字母 表征 ,其 中 ,第 一 个 
数字 是 指 三 元 组 模 体 中 互惠 对 的 个 数 ;第 二 个 数字 是 
指 不 对 称 对 的 个 数 ;第 三 个 数字 是 指 虚 无 对 的 个 数 ;最 
后 一 个 字母 (如 果 需 要 的 话 ) 用 于 对 相似 的 两 个 三 元 
组 模 体 进行 区 分 :“T” 代表 “传递 ”关系 ,“C” 代表 “ 循 
环 ” 关 系 ,“D” 代表“ 向 下 ”关系 ,“U” 代 表 “ 向 上 ” 关 
AL 

对 于 由 x、y、z 三 个 学 科 构 成 的 三 元 组 模 体 , 如果 
学 科 z 引证 了 学 科 x( 即 学 科 x 的 知识 借助 文献 引证 流 
向 了 学 科 z) ,同时 学 科 y 引 证 了 学 科 z( 即 学 科 z 的 知 
识 经 由 文献 引证 媒介 扩散 至 学 科 y ) ,不 管 学 科 x 和 学 
科 y 之 间 是 否 存 在 引证 知识 关联 ,本 文 都 将 其 统称 为 
传递 三 元 组 模 体 。 传 递 三 元 组 模 体 是 利用 共同 邻居 相 
似 性 指标 进行 学 科 引 证 知识 扩散 动态 链 路 预测 的 前 
提 。 根 据 学 科 间 引证 频次 的 大 小 ,传递 三 元 组 模 体 中 
的 连 边 可 划分 为 2 类 : 强 连 接 和 弱 连 接 。 根 据 学 科 引 
证 知识 扩散 网 络 的 连 边 权 重 分 布 情况 , 设 定 某 一 阔 值 
m, 两 学 科 间 单 向 引证 次 数 大 于 等 于 m 的 连 边 称 为 强 
连接 ,小 于 m 的 连 边 称 为 弱 连 接 。 学 科 引 证 知识 扩散 
网 络 中 , 强 弱 连接 传递 三 元 组 模 体 包括 以 下 4 种 类 型 
(ss ww .sw ,ws) , 见 图 3。 其 中 ,学 科 x 指向 学 科 z 以 及 
学 科 z 指向 学 科 y 的 粗 线 表示 强 连 接 , 细 线 表 示弱 连 
接 ;虚线 表示 可 能 存在 连接 ,也 可 能 不 存在 连接 ;学 科 
x 指向 学 科 y 的 实 线 表示 学 科 x 的 知识 以 文献 引证 为 
载体 传播 至 学 科 y ,否则 表示 不 存在 连接 。 

以 上 4 类 传递 三 元 组 模 体 从 强 弱 连接 视角 反映 了 
邻居 学 科 z 与 学 科 x 学科 y 之 间 的 引证 知识 关联 
模式 : 
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学 科 引 证 知识 扩散 网 络 中 的 强 弱 
连接 传递 三 元 组 模 体 


(1)ss: 由 强 到 强 型 , 即 学 科 z 作为 中 介 学 科 与 知 
扩散 源 学 科 x、 知 识 扩 散 宿 学 科 y 都 存在 强 引证 关联 ; 

(2)ww: 由 弱 到 弱 型 , 即 学 科 z 作为 中 介 学 科 与 知 
扩散 源 学 科 x、 知 识 扩 散 宿 学 科 y 都 存在 弱 引 证 关联 ; 


科 y 存在 弱 引 证 关联 ; 

(4)ws: 由 弱 到 强 型 , 即 知 扩散 源 学 科 x 与 中 介 学 
科 z 存 在 弱 引 证 关联 ,而 中 介 学 科 z 与 知识 扩散 宿 学 
科 y 存在 强 引 证 关联 。 

在 学 科 引 证 知识 扩散 动态 链 路 预测 过 程 中 ,如 果 
强 连接 起 到 更 加 重要 的 作用 ,那么 对 于 由 学 科 x、 学 科 
z 以 及 学 科 z、 学 科 y 构成 的 两 条 强 连接 , 即 ss 型 传递 
三 元 组 模 体 来 说 ,学 科 x 和 学 科 y 相连 接 的 概率 就 较 
大 。 同 理 ,如 果 弱 连接 起 到 更 加 重要 的 作用 ,那么 对 于 
由 学 科 x、 学 科 z 以 及 学 科 z、 学 科 y 构成 的 两 条 弱 连 
接 , 即 ww 型 传递 三 元 组 模 体 来 说 ,学 科 x 和 学 科 y TH 
连接 的 概率 就 较 大 。 基 于 此 ,以 Pss 、Pww、Psw、Pws 分 
别 表示 不 同 强 弱 连接 传递 三 元 组 模 体 类 型 中 具有 共同 
邻居 的 两 学 科 存 在 引证 知识 扩散 关联 的 比率 ,进而 衡 


(3)sw: 由 强 到 弱 型 , 即 知 扩散 源 学 科 x 与 中 介 学 


FE 关联 ， 而 中 介 学 科 z 与 知识 扩散 宿 学 


量 不 同 权重 影响 下 学 科 连 边 的 倾向 性 ,其 含义 及 意义 
如 表 2 所 示 : 


表 2 学 科 引 证 知识 扩散 网 络 强 弱 连 接 传递 三 元 组 模 体 连 边 比 率 


含义 


SERE z 与 知 扩散 源 学 科 x、 知 识 扩散 宿 学 科 y 都 存在 。 反映 了 两 学 科 通过 包含 2 条 强 连 接 的 路 径 相连 通 时 ,其 直接 存在 引证 知识 扩散 关系 的 可 能 
强 引证 关联 时 ,学 科 x 直接 向 学 科 y 以 文献 引证 的 形 ”性 大 小 。 该 值 越 大 ,说 明 强 连接 在 学 科 引 证 知识 扩散 网 络 演化 及 动态 链 路 预测 过 程 中 起 到 
式 洪 出 知识 的 概率 更 加 重要 的 作 

学 科 z 与 知 扩散 源 学 科 x、 知 识 扩 散 宿 学 科 y 都 存在 ”反映 了 两 学 科 通 过 包含 2 条 弱 连 接 的 路 径 相 连通 时 ,其 直接 存在 引证 知识 扩散 关系 的 可 能 
弱 引 证 关联 时 ,学科 x 直接 向 学 科 y 以 文献 引证 的 形 ”性 大 小 。 该 值 越 大 ,说 明 弱 连接 在 学 科 引 证 知识 扩散 网 络 演化 及 动态 链 路 预测 过 程 中 起 到 
式 淤 出 知识 的 概率 更 加 重要 的 作用 

学 科 z 与 知 扩散 源 学 科 x 存在 强 引证 关联 ,而 与 知识 ” 反映 了 两 学 科 通 过 包含 1 条 强 连接 和 1 条 弱 连 接 的 路 径 相 连通 时 ,其 直接 存在 引证 知识 扩 
扩散 宿 学 科 y 存在 弱 引 证 关联 时 ,学 科 x 直接 向 学 科 ” 散 关 系 的 可 能 性 大 小 。 该 值 越 大 ,说 明知 扩散 源 学 科 的 洪 出 辐射 能 力 高 于 知识 宿 学 科 的 吸 
y 以 文献 引证 的 形式 洪 出 知识 的 概率 纳 融合 能 力 时 ,二 者 之 间 产 生 直接 知识 转移 行为 的 倾向 性 越 明显 

SERE z 与 知 扩散 源 学 科 x 存在 弱 引证 关联 ,而 与 知识 ”反映 了 两 学 科 通 过 包含 1 条 弱 连 接 和 1 条 强 连接 的 路 径 相 连通 时 ,其 直接 存在 引证 知识 扩 
扩散 宿 学 科 y 存在 强 引证 关联 时 ,学科 x 直接 向 学 科 ” 散 关 系 的 可 能 性 大 小 。 该 值 越 大 ,说 明知 识 宿 学 科 的 吸纳 融合 能 力 高 于 知 扩散 源 学 科 的 溢 
y 以 文献 引证 的 形式 洪 出 知识 的 概率 出 辐射 能 力 时 ,二 者 之 间 产 生 直接 知识 转移 行为 的 倾向 性 越 明显 


3 ”研究 对 象 的 选择 与 数据 获取 


4 数据 处 理 与 结果 分 析 


根据 前 期 对 于 学 科 引 证 知识 扩散 动态 链 路 预测 的 
研究 ”, 本 文选 取 预 测 效 果 稳 定性 较 高 的 2006 -2016 
年 社会 网 络 领 域 学 科 引 证 知识 扩散 网 络 为 研究 对 象 ， 
探索 学 科 引 证 知识 强 弱 连接 对 于 动态 链 路 预测 过 程 的 
影响 。 

在 Web of Science 中 ,以 “TS = “social network * "" 
为 检索 策略 ,收集 2006 -2016 年 SCI-EXPANDED ,SSCI 
数据 库 中 ,类 型 为 "articles ”的 文献 ,去 重 、 清 洗 后 得 到 
文献 25 539 篇 。 根 据 期 刊 引 证 报告 (JCR) 的 期 刊 所 属 
学 科 类 别 对 照 表 ,在 期 刊 引 证 数据 的 基础 上 ,抽取 历年 
学 科 引 证 知识 扩散 时 序 演化 网 络 。 


4.1 基于 权重 调节 的 学 科 引 证 知识 扩散 动态 链 路 预 
测 强 弱 连 接 效应 分 析 
含 权 学 科 引 证 知识 扩散 动态 链 路 预测 共同 邻居 相 
似 性 指标 的 AUC 值 随 参 数 a 的 变化 情况 如 图 4 所 示 。 
文中 所 涉及 的 AUC 值 均 为 利用 2006 -2016 年 的 时 序 
演化 网 络 ,以 1 年 为 间隔 进行 10 次 迭代 动态 链 路 预测 
所 得 预测 精度 的 平均 值 ” 。 
由 图 4 可 知 , 除 HDI 指标 外 , 随 着 参数 a 逐渐 增 
大 ,其 他 7 项 指标 的 预测 效能 都 呈现 先 上 升 后 下 降 的 
趋势 ,但 变动 幅度 不 尽 相 同 。 其 中 ,CN AA RA 指标 精 
度 先 是 迅速 增加 , 当 达 到 峰值 后 ,缓慢 下 降 ;Salton , HPI 
间 标 精度 在 攀升 至 顶峰 后 ,迅速 下 滑 ;Jaccard .Sorenson 
指标 精度 的 演变 形态 近 于 一 致 ,都 表现 为 先 微弱 上 升 ， 
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4 ” 含 权 学 科 引 证 知识 扩散 动态 链 路 预测 共同 邻居 相似 性 指标 的 AUC 值 随 参 数 a 的 变化 


后 逐渐 下 降 的 态势 。 当 & 小 于 0 时 ,HDI 指标 的 预测 
表现 较为 平稳 ; 当 w 大 于 0 后 , 则 呈现 波动 下 滑 态势 。 
CO 3 为 无 权 加权 以 及 含 权 最 优 参数 (即使 得 预测 


LC) 


准确 度 达到 最 高 值 的 参数 a) 下 学 科 引 证 知识 扩散 动 
态 链 路 预测 共同 邻居 相似 性 指标 的 AUC 值 。 


RI 无 权 、 加 权 以 及 含 权 最 优 参 数 下 学 科 引 证 知识 扩散 动态 链 路 预测 共同 邻居 相似 性 指标 的 AUC fü 


CE 邻居 相似 性 指标 CN Salton Jaccard Sorenson HPI HDI AA RA 
e 无 权 0.765 82 0.755 94 0.746 25 0. 746 66 0.722 37 0. 736 73 0.766 88 0.767 01 
er 加 权 0.772 71 0.754 82 0. 742 81 0. 742 95 0.716 13 0. 731 95 0. 773 51 0.772 22 

最 优 参数 a 0. 773 30 0.761 59 0. 746 39 0.746 74 0.723 15 0. 738 49 0. 774 03 0. 772 10 
Cin de 3 可 知 ,对 于 学 科 引 证 知识 扩散 时 序 演化 网 | 1380. 77403) ,CN RA 指标 的 表现 次 之 ,HPI 指标 的 巴 


e 

Z E IUMCRUE T5872) 8278 RUN SEBURUUE E E 2d 
纯 无 权 和 加 权 指 标 均 有 不 同 程度 的 提升 。 其 中 ,AA 指 
标 奉 最 优 参数 a 下 的 预测 效果 最 好 ( 其 预测 精度 均值 


测 精度 最 优 均 值 仅 为 0.72315 ,居于 末 位 。 
表 4 为 不 同 共同 邻居 相似 性 指标 下 的 链 路 预测 最 
优 参数 ao 


© 表 4 不 同 共 同 邻 居 相 似 性 指标 下 学 科 引 证 知识 扩散 动态 链 路 预测 最 优 参数 w 
x Egg 居 相 似 性 指标 CN Salton Jaccard Sorenson HPI HDI AA RA 
CC ”最 优 参 数 a 0.8 0.5 0.2 0.2 0.2 -0.8 0.8 0.8 


d 4 中 ,HDI 指标 的 最 优 参数 为 负 值 ,说明 利用 其 
进行 动态 链 路 预测 时 ,如 果 提 升 弱 知 识 引 证 连 边 的 权 
,降低 强 连 边 的 权重 ,会 得 到 更 佳 预测 表现 , 即 弱 连 
接 扮演 着 更 加 重要 的 角色 。 

HR 7 项 指标 的 最 优 参 数 都 为 正 值 ,说 明 利用 这 
些 指标 进行 动态 链 路 预测 时 , 强 连接 起 着 更 为 重要 的 
作用 。 然 而 ,其 最 优 参数 都 小 于 1 ,说 明 当 学 科 间 的 引 
证 关联 强度 发 生 适度 衰减 时 (0 < a « 1) ,往往 能 取得 
最 佳 动态 链 路 预测 效果 ,也 就 是 说 ,虽然 强 连 接 更 重要 
但 是 并 未 达到 其 权重 显示 的 重要 程度 。CN .AA .RA JH 
标的 最 优 参数 值 相对 于 其 他 4 项 指标 较 大 ,说 明 三 者 
的 强 连 接 效 应 影响 更 加 显著 。 

对 于 不 同 的 共同 邻居 相似 性 指标 来 说 , 强 弱 连 接 
关系 对 学 科 引 证 知识 扩散 动态 链 路 预测 过 程 的 影响 程 
度 存 在 一 定 差异 。 但 是 ,综合 来 看 ,学 科 引 证 知识 扩散 


Uimli 


时 序 演化 网 络 中 的 强 连接 效应 更 为 明显 , 即 权 重 较 大 
的 强 连接 对 于 预测 准确 度 的 提升 贡献 更 大 。 
4.2 基于 连 边 失效 的 学 科 引 证 知识 扩散 动态 链 路 预 
测 强 弱 连接 效应 分 析 

利用 Matlab 模拟 不 同 连 边 失效 策略 下 ,不 同 相 似 
性 算法 指标 在 学 科 引 证 知识 扩散 时 序 演化 网 络 中 的 动 
态 链 路 预测 性 能 变化 ,结果 如 图 5 所 示 ( 横 坐标 为 按照 
学 科 引 证 连 边 权重 大 小 ,由 强 到 弱 / 由 弱 到 强 顺 次 移 除 
连 边 的 比例 ; 纵 坐 标 为 利用 移 除 连 边 后 的 网 络 进行 迭 
代 动 态 链 路 预测 时 的 AUC 值 ) 。 
由 图 5 可 看 出 , 随 着 学 科 引 证 连 边 的 减少 ,各 项 指 
标的 预测 精度 出 现 不 同 程度 的 损失 , 当 学 科 间 的 引证 
关联 全 部 消失 ( 即 移 除 边 数 比例 达到 100% ) 时 ,动态 
链 路 预测 AUC 值 下 降 至 0.5 ,与 所 有 预测 连 边 的 相似 
度 值 都 是 随机 产生 的 情形 相当 。 对 于 8 项 指标 来 说 ， 
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一 一 由 强 到 弱 移 除 边 
~ 一 由 弱 到 强 移 除 边 
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2 
o 
Un 


chinaXiv 


0 10 20 30 40 50 60 70 80 90 100 


移 除 边 数 比例 /% 
(B) AA 
图 5 不 同 连 


移 除 弱 连 接 时 的 预测 精度 下 降 速 度 都 较为 平缓 , 弱 连 
接 移 除 量 达 到 40% 左右 时 ,指标 预测 AUC. 值 才 开始 出 

现 较为 明显 的 下 滑 , 说 明 弱 连 接 失 效 对 于 学 科 引 证 知 
识 扩散 动态 链 路 预测 效能 的 影响 较 小 , 即 学 科 引 证 知 
识 扩散 时 序 演 化 网 络 对 于 弱 连 接 失 效 具 有 较 强 的 鲁 棒 
性 ,其 弱 连 接 容 错 能 力 较 大 。 而 强 连 接 失 效 策 略 下 , 预 
测 精度 的 变化 较为 急促 ,说 明 强 连接 对 于 学 科 引 证 知 
识 扩散 动态 链 路 预测 性 能 维持 度 的 作用 更 加 明显 , 即 


AUC 


AUC 


AUC 


AUC 


边 失效 策略 下 学 科 引 证 知识 扩散 动态 链 路 预测 性 外 
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5 
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(d) Sorenson 
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100 
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(h) RA 


变化 


网 络 的 强 连接 抗 攻击 能 力 较 小 。 两 种 连 边 失效 策略 
下 ,Salton .HPI 指标 的 动态 链 路 预测 性 能 变化 曲线 差 
异 最 大 ,Jaccard , Sorenson , HDI 指标 次 之 ,CN 、AA RA 
指标 的 差异 最 小 ,说 明 不 同 指 标 对 于 强 弱 连接 (尤其 是 
强 连接 ) 缺 失 的 敏感 性 存在 一 定 差异 ,预测 精度 衰减 速 
度 越 快 , 其 敏感 性 越 高 。 

值得 注意 的 是 ,前 述 研 究 发 现 HDI 指标 的 最 优 权 
重 调节 参数 为 负 值 , 即 利用 其 进行 学 科 引 证 知识 扩散 
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动态 链 路 预测 时 , 弱 连 接 起 到 更 加 重要 的 作用 。 而 权 
重 差异 化 连 边 失效 策略 下 ,对 于 HDI 指标 来 说 , 强 连接 
对 于 其 预测 效能 维持 能 力 的 影响 更 加 明显 。 二 者 似乎 
存在 矛盾 之 处 , 究 其 原因 在 于 , 移 除 连 边 策略 在 改变 强 
弱 连 接 权 重 的 同时 ,学 科 间 共同 邻居 的 数目 也 会 发 生 
变化 , 模 体 结构 分 布 亦 随 之 改变 ,因此 同一 指标 的 预测 


元 组 模 体 类 型 相对 比率 


2008 2010 


6 ”学科 引证 知识 扩散 时 序 


C9 由 图 6 可 知 ,003 模 体 在 网 络 中 所 占 的 比例 最 大 ， 
学 科 引 证 知识 扩散 网 络 中 有 相当 一 部 分 的 学 科 较 
A 
体 和 102 模 体 的 比重 次 之 ,说 明 学 科 之 间 的 二 元 
NIGP NAAR RANA ARIA 


04.00566v1 


出 的 单 向 知识 流动 比 双向 互惠 融合 特性 更 加 显著 。 
HIR, PH 0210 模 体 数量 多 于 021D 模 体 ,说 明 对 于 
社 父 网 络 领 域 学 科 来 说 , 当 其 邻居 学 科 之 间 不 存在 直 
接 久 证 关系 时 ,其 共 引 知识 汇聚 的 能 力 要 大 于 耦合 知 
识 渗透 能 力 。 


1 
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精度 变化 趋向 也 可 能 会 产生 一 定 的 差异 。 
4.3 学科 引 证 知识 扩散 时 序 演 化 网 络 强 弱 连接 模 体 
分 析 

学 科 引 证 知识 扩散 时 序 演 化 网 络 中 ,16 种 三 元 组 
模 体 类 型 的 相对 比率 如 图 6 所 示 : 


2012 2013 2014 2015 2016 


演化 网 络 三 元 组 模 体 类 型 相对 比率 


随 着 时 间 的 推移 ,003 模 体 的 比重 越 来 越 小 ,102 
模 体 的 比重 逐渐 提高 ,说 明 社 会 网 络 领域 学 科 之 间 的 
引证 知识 交流 (尤其 是 双向 知识 传播 ) 越 来 越 密切 ,网 
络 连 通 性 稳步 提升 ,愈加 利于 知识 在 学 科 中 的 横向 拓 
展 及 纵向 渗透 。 

然而 ,以 上 类 型 的 模 体 都 不 具备 传递 性 , 即 不 属于 
传递 三 元 组 模 体 。 传 递 三 元 组 模 体 是 利用 共同 邻居 相 
人 
提 。 学 科 引 证 知识 扩散 时 序 演化 网 络 中 ,11 种 传递 
元 组 模 体 类 型 的 相对 比率 如 图 7 所 示 : 
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7. 学 科 引证 知识 扩散 时 序 演 化 网 络 传递 三 元 组 模 体 类 型 相对 比率 
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由 图 7 可 知 ,在 具有 传递 性 的 三 元 组 模 体 中 ， 
021C 111D \111U 和 201 模 体 占有 较 大 的 比重 ,说 明 相 
当 一 部 分 与 中 介 学 科 都 存在 知识 引证 关系 的 其 他 两 学 
科 之 间 并 不 直接 连通 。 随 着 时 间 的 推移 ,210 300 模 体 
的 数量 不 断 增加 ,学 科 间 的 双向 知识 交流 关联 愈加 富 
集 ,互惠 连通 率 逐 渐 提 升 。 

为 进一步 从 引证 知识 关联 强度 的 视角 ,明晰 学 科 
引证 知识 扩散 网 络 的 时 序 演 化 本 质 规 律 , 以 Pss、Pww、 
Psw Pws 分 别 表 示 不 同 强 弱 连接 传递 三 元 组 模 体 类 型 
中 具有 共同 邻居 的 两 学 科 存 在 引证 知识 扩散 关联 的 比 
率 ,进而 衡量 不 同 权 重 影响 下 学 科 连 边 的 倾向 性 ,为 学 
科 引 证 知识 扩散 动态 链 路 预测 算法 指标 的 设计 优化 提 
供 支撑 。2006 - 2016 年 间 共 涉及 11 个 学 科 引 证 知识 
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(e) 2014 


扩散 时 间 切 片 网 络 ,笔者 采用 间隔 抽样 的 方式 ,抽取 了 
6 个 子 网 络 进行 分 析 , 强 弱 连接 传递 三 元 组 模 体 连 边 
比率 如 图 8 所 示 。 其 中 , 横 坐 标 表示 该 年 学 科 引 证 知 
识 扩散 网 络 中 连 边 权重 由 小 到 大 排列 的 序号 ,具体 来 
说 , 先 将 学 科 之 间 互 不 重复 的 引证 连 边 权 重 值 由 小 到 
大 排列 (最 小 的 边 权 重 为 0, 即 不 存在 学 科 引 证 关联 ) , 
然后 用 上 自然 数 (0、1、2、……:) 依 次 给 这 些 连 边 权 重 赋 予 
等 级 序号 ,该 序号 代表 对 应 连 边 权 重大 小 在 边 权 集中 
所 处 的 相对 位 置 ; 纵 坐 标 表 示 以 不 同 连 边 权重 作为 强 
弱 连 接 划 分 国 值 时 ,学 科 引 证 知识 扩散 网 络 中 由 强 到 
强 (ss) 由 弱 到 弱 (ww) 由 强 到 弱 (sw) 以 及 由 弱 到 强 
(ws) 四 种 强 弱 连接 传递 三 元 组 模 体 的 连 边 比 率 。 
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图 8 学 科 引 证 知识 扩散 时 序 演化 网 络 强 弱 连接 传递 三 元 组 模 体 连 边 比 率 


由 图 8 可 知 ,在 社会 网 络 领域 学 科 引 证 知识 扩散 
网 络 中 ,两 学 科 通过 包含 2 条 强 连 接 的 路 径 相 连通 时 ， 
其 直接 存在 引证 知识 扩散 关系 的 可 能 性 (Pss) 要 远大 
于 通过 包含 2 条 弱 连 接 的 路 径 相 连通 时 ,其 直接 存在 
引证 知识 扩散 关系 的 可 能 性 (Pww) 。 尤 其 是 当 邻 居 学 


PE z 与 知 扩散 源 学 科 x、 知 识 扩 散 宿 学 科 y 都 存在 非常 
强 的 引证 关联 ( 即 连 边 权重 都 很 大 ) 时 ,学 科 x 直接 向 
AERE y 以 文献 引证 的 形式 溢出 知识 的 概率 可 达到 
100% 。 因 此 ,从 整体 上 看 , 强 连接 比 弱 连接 更 能 够 促 
进 学 科 间 引证 知识 关联 链 路 的 产生 ,在 学 科 引 证 知识 
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扩散 网 络 演化 及 动态 链 路 预测 过 程 中 起 到 更 加 重要 的 
作用 。 
另外 , 自 2012 年 以 来 , 当 两 学 科 通 过 一 强 一 弱 2 


规律 ,但 对 于 强 弱 连接 权重 因素 的 考量 仍 有 竺 进一步 完 
善 。 从 整体 上 看 , 强 连接 在 学 科 引 证 知识 扩散 网 络 演化 
及 动态 链 路 预测 过 程 中 扮演 着 更 加 重要 的 角色 。 因 此 ， 


条 路 径 相连 通 时 , 奉 知 识 宿 学 科 的 吸纳 融合 能 力 高 于 
知识 扩散 源 学 科 的 溢出 辐射 能 力 , 则 二 者 之 间 产 生 直 
接 知识 转移 行为 的 概率 更 会 高 (Pws > Psw) , 且 该 演化 
特性 与 强 弱 连接 切 分 闵 值 的 大 小 无 关 。 


5 结论 


本 文 依托 内 外 协同 的 思路 理念 ,构建 了 一 种 外 部 
网 络 结构 调控 与 内 部 微观 演化 机 理 剖析 相 结合 的 动态 
链 路 预测 强 弱 连 接 效应 探测 方法 ,从 学 科 引 证 知识 关 
联 权重 调节 、 连 边 失效 触发 以 及 强 弱 连接 模 体 分 析 三 个 
维度 ,对 学 科 引 证 知识 扩散 动态 链 路 预测 中 的 强 弱 连 接 
效应 问题 进行 了 深入 探索 与 系统 讨论 ,为 强 弱 连 接 理论 
共 牢 各 加 权 动态 网 络 链 路 预测 中 的 应 用 拓展 提供 了 支 
撑 鱼 富 与 完善 了 动态 链 路 预测 中 强 弱 连 接 效 应 探测 方 
溪 醒 系 , 为 学 科 引 证 知识 扩散 行为 微观 演化 规律 的 揭示 
以 及 动态 链 路 预测 算法 指标 的 评价 .设计 与 优化 提供 了 
可 次 借鉴 的 理论 和 实践 参考 。 主 要 得 到 以 下 结论 : 

)(1 ) 对 于 不 同 的 共同 邻居 相似 性 指标 来 说 , 强 弱 
送 潮 关系 对 学 科 引 证 知识 扩散 动态 链 路 预测 过 程 的 影 
响 程度 存在 一 定 差异 。 链 路 预测 “ 强 弱 连 接 效应 "是 
针对 算法 指标 而 言 的 ,并 不 完全 代表 网 络 本 身 的 连 边 
演 楷 特性 。 综 合 来 看 ,权重 较 大 的 强 连 接 对 于 预测 准 
确 谭 的 提升 贡献 更 大 。 

C2) 从 缺失 性 视角 来 看 , 强 连接 对 于 学 科 引证 知 
识 驴 散 动态 链 路 预测 效能 维持 能 力 的 作用 更 加 明显 ; 
学 逢 引证 知识 扩散 时 序 演化 网 络 对 于 弱 连 接 失效 具有 
较 强 的 鲁 棒 性 , 其 弱 连 接 容错 能 力 较 大 。 不 同 指标 对 
于 强 弱 连接 (尤其 是 强 连接 ) 缺失 的 敏感 性 也 不 尽 相 
同 。 另 外 ,动态 链 路 预测 中 的 强 弱 连接 现象 不 仅 与 学 
科 引 证 关联 权重 有 关 , 还 会 受到 共同 邻居 数目 以 及 网 
络 微观 模 体 结构 的 影响 。 

(3) 随 着 时 间 的 推移 ,社会 网 络 领域 学 科 之 间 的 
引证 知识 交流 (尤其 是 双向 知识 传播 ) 越 来 越 密切 ,网 
络 连 通 性 稳步 提升 ,为 知识 在 学 科 中 的 横向 拓展 及 纵 
向 渗透 提供 了 有 利 条 件 。 两 学 科 与 邻居 学 科 之 间 的 引 
证 关联 强度 越 大 , 则 这 两 个 学 科 之 间 直 接 发 生 知识 转 
移 的 概率 越 高 。 同 时 ,知识 宿 学 科 的 吸纳 融合 能 力 相 
对 于 知识 源 学 科 的 溢出 辐射 能 力 来 说 ,在 新 连 边 的 衍 
生 过 程 中 的 主导 地 位 更 加 突出 。 

(4) 大 部 分 基于 共同 邻居 相似 性 的 链 路 预测 指标 的 
设计 理念 基本 符合 学 科 引 证 知识 扩散 网 络 的 连 边 演化 


突出 大 权重 强 连接 在 预测 指标 设计 中 的 作用 ,是 提升 学 
科 引 证 知识 扩散 动态 链 路 预测 性 能 的 有 效 途 径 。 
此 外 ,本 文 仅 对 社会 网 络 领 域 范 围 内 基于 共同 邻 
居 相 似 性 的 学 科 引 证 知识 扩散 动态 链 路 预测 过 程 中 的 
强 弱 连接 效应 问题 进行 了 分 析 , 结 论 的 可 推广 性 有 符 
进一步 验证 。 虽 然 研 究 发 现 强 连接 占 主导 地 位 ,然而 
弱 连 接 作 为 一 种 特有 的 学 科 交 互 模式 在 知识 传播 演化 
过 程 中 也 发 挥 了 不 可 忽视 的 作用 。 具 有 强 连 接 的 学 科 
间 往 往 具 有 较 大 的 知识 同 质 性 ,学 科 吸收 融合 和 传播 
同 质 性 知识 ,一 定 程度 上 有 助 于 学 科 在 现 有 基础 上 进 
行 理论 .技术 方法 等 方面 的 常规 性 发 展 与 渐进 性 创 
新 ;而 具有 弱 连 接 关系 的 学 科 间 知识 资源 异 质 化 特征 
明显 ,此 类 知识 的 交叉 融合 有 利于 颠覆 性 技术 生长 点 
的 衍生 ,从 而 推动 学 科 取 得 突破 性 创新 ,实现 飞跃 式 发 
展 。 强 连接 和 弱 连接 相辅相成 ,如 何在 学 科 知 识 扩散 
动态 链 路 预测 过 程 中 实现 强 弱 连接 有 机 结合 ,是 有 待 
深入 研究 的 重要 问题 之 一 。 

下 一 步 将 在 深入 挖掘 并 准确 把 握 学 科 引 证 知识 扩 
散 行为 本 质 机 理 的 基础 上 ,从 模 体 演化 微观 视角 出 发 ， 
合理 利用 强 弱 连接 权重 信息 ,同时 从 中 观 层面 结合 学 
科 社 区 属性 信息 ,优化 学 科 引 证 知识 扩散 时 序 动态 链 
路 预测 方法 ,提升 预测 效能 。 
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"== Abstract; | Purpose/significance | The strong and weak ties is one of the important factors that affect the dy- 
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ic link prediction of knowledge diffusion in disciplinary citation networks. The strong and weak citation ties in 
diffusion of disciplinary knowledge jointly promote knowledge exchange, integration and innovation among disciplines 
"With coordination and mutual effect. The exploration of strong and weak ties in the dynamic link prediction of knowl- 
edge diffusion in disciplinary citation networks can provide theoretical and practical references for expanding the ap- 
plication of the strong and weak ties theory , revealing the micro-evolution law of knowledge diffusion behavior of dis- 
ciplinary citation, and evaluating, designing and optimizing dynamic link prediction algorithm indicators. | Method/ 
process | In this paper, on the basis of synergistic idea, the method of detecting strong and weak ties in the dynamic 
link prediction was constructed by controlling external structure and analyzing internal evolution mechanism of the 
networks. To be specific, the influence of strong and weak ties on the dynamic link prediction of knowledge diffusion 
in disciplinary citation networks based on common neighbor similarity was discussed from three perspectives of adjust- 
ment of knowledge connection weight in disciplinary citation networks, link failure triggering and motif analysis. 
| Result/conclusion | The research has shown that, firstly, strong ties play a more important role in evolution of 
knowledge diffusion in disciplinary citation networks and dynamic link prediction; secondly, strong and weak ties 
effect in link prediction is not only related to connection weight of disciplinary citation networks, but affected by the 
number of common neighbor and micro motif structure; thirdly, compared with the spillover ability of knowledge from 
source discipline, the absorbing ability of knowledge in destination discipline has a more prominent impact on the 
process of developing new knowledge links. 
Keywords: knowledge diffusion in disciplinary citation networks strong ties and weak ties weight adjustment 


link failure triad motif dynamic link prediction 


76 


